Chip 2006 June

home *** CD-ROM | disk | FTP | other *** search

/ Chip 2006 June / CHIP 2006-06.2.iso / program / freeware / Democracy-0.8.2.exe / xulrunner / python / item.py < prev next >

Wrap

Python Source | 2006-04-10 | 28.8 KB | 970 lines

from datetime import datetime, timedelta from database import DDBObject, defaultDatabase from downloader import DownloaderFactory from copy import copy from xhtmltools import unescape,xhtmlify from xml.sax.saxutils import unescape from scheduler import ScheduleEvent from feedparser import FeedParserDict from threading import Thread from math import ceil from templatehelper import escape import threadpriority import config import os import feed ## # An item corresponds to a single entry in a feed. Generally, it has # a single url associated with it class Item(DDBObject): manualDownloads = defaultDatabase.filter(lambda x:isinstance(x,Item) and x.getState() == "downloading" and not x.getAutoDownloaded()) def __init__(self, feed, entry, linkNumber = 0): self.feed = feed self.seen = False self.downloaders = [] self.vidinfo = None self.autoDownloaded = False self.startingDownload = False self.lastDownloadFailed = False self.pendingManualDL = False self.pendingReason = "" self.entry = entry self.dlFactory = DownloaderFactory(self) self.expired = False self.keep = False # linkNumber is a hack to make sure that scraped items at the # top of a page show up before scraped items at the bottom of # a page. 0 is the topmost, 1 is the next, and so on self.linkNumber = linkNumber self.creationTime = datetime.now() DDBObject.__init__(self) # Unfortunately, our database does not scale well with many views, # so we have this hack to make sure that unwatched and available # get updated when an item changes def endChange(self): DDBObject.endChange(self) self.feed.updateUandA() # # Returns True iff this item has never been viewed in the interface # Note the difference between "viewed" and seen def getViewed(self): return self.creationTime <= self.feed.lastViewed ## # Returns the URL associated with the first enclosure in the item def getURL(self): ret = '' self.beginRead() try: try: ret = self.entry.enclosures[0].url except: pass finally: self.endRead() return ret ## # Returns the feed this item came from def getFeed(self): self.beginRead() ret = self.feed self.endRead() return ret ## # Returns the number of videos associated with this item def getAvailableVideos(self): ret = 0 self.beginRead() try: ret = len(self.entry.enclosures) finally: self.endRead() return ret ## # Marks this item as expired def expire(self): self.beginRead() try: self.stopDownload() # FIXME: should expired items be marked as "seen?" # self.markItemSeen() self.expired = True finally: self.endRead() self.beginChange() self.endChange() ## # Returns string with days or hours until this gets deleted def getExpirationTime(self): ret = "???" self.beginRead() self.feed.beginRead() try: if self.feed.expire == 'never' or (self.feed.expire == 'system' and config.get(config.EXPIRE_AFTER_X_DAYS) <= 0): ret = "never" else: if self.feed.expire == "feed": expireTime = self.feed.expireTime elif self.feed.expire == "system": expireTime = timedelta(days=config.get(config.EXPIRE_AFTER_X_DAYS)) exp = expireTime - (datetime.now() - self.getDownloadedTime()) if exp.days > 0: ret = "%d days" % exp.days elif exp.seconds > 3600: ret = "%d hours" % (ceil(exp.seconds/3600.0)) else: ret = "%d min." % (ceil(exp.seconds/60.0)) finally: self.feed.endRead() self.endRead() return ret def getKeep(self): self.beginRead() ret = self.keep self.endRead() return ret def setKeep(self,val): self.beginRead() self.keep = val self.endRead() self.beginChange() self.endChange() ## # returns true iff video has been seen # Note the difference between "viewed" and "seen" def getSeen(self): self.beginRead() ret = self.seen self.endRead() return ret ## # Marks the item as seen def markItemSeen(self): self.beginChange() try: self.seen = True finally: self.endChange() ## # Returns a list of downloaders associated with this object def getDownloaders(self): self.beginRead() ret = self.downloaders self.endRead() return ret def getRSSID(self): self.beginRead() try: ret = self.entry["id"] finally: self.endRead() return ret ## # Returns the vidinfo object associated with this item def getVidInfo(self): self.beginRead() ret = self.vidinfo self.endRead() return ret def setAutoDownloaded(self,autodl = True): self.beginRead() self.autoDownloaded = autodl self.endRead() def getPendingReason(self): ret = "" self.beginRead() ret = self.pendingReason self.endRead() return ret ## # Returns true iff item was auto downloaded def getAutoDownloaded(self): self.beginRead() ret = self.autoDownloaded self.endRead() return ret ## # Returns the linkNumber def getLinkNumber(self): self.beginRead() try: ret = self.linkNumber finally: self.endRead() return ret def download(self,autodl=False): thread = Thread(target = lambda:self.actualDownload(autodl), name = "Item download -- %s" % (self.getURL(), )) thread.setDaemon(False) thread.start() ## # Starts downloading the item def actualDownload(self,autodl=False): threadpriority.setNormalPriority() spawn = True self.beginRead() try: # FIXME: For locking reasons, downloaders don't always # call beginChange() and endChange(), so we have to # recompute this filter defaultDatabase.recomputeFilter(self.manualDownloads) if ((not autodl) and self.manualDownloads.len() >= config.get(config.MAX_MANUAL_DOWNLOADS)): self.pendingManualDL = True self.pendingReason = "Too many manual downloads" spawn = False self.expired = False else: #Don't spawn two downloaders if self.startingDownload: spawn = False else: self.setAutoDownloaded(autodl) self.expired = False self.keep = False self.pendingManualDL = False self.lastDownloadFailed = False downloadURLs = map(lambda x:x.getURL(),self.downloaders) self.startingDownload = True try: enclosures = self.entry["enclosures"] except: enclosures = [] finally: self.endRead() self.beginChange() self.endChange() if not spawn: return try: for enclosure in enclosures: try: if not enclosure["url"] in downloadURLs: dler = self.dlFactory.getDownloader(enclosure["url"]) if dler != None: self.beginRead() try: self.downloaders.append(dler) finally: self.endRead() else: self.beginRead() try: self.lastDownloadFailed = True finally: self.endRead() downloadURLs.append(dler.getURL()) else: for dler in self.downloaders: if dler.getURL() == enclosure['url']: dler.start() except KeyError: pass except KeyError: pass self.beginRead() try: self.startingDownload = False finally: self.endRead() self.beginChange() self.endChange() ## # Returns a link to the thumbnail of the video def getThumbnail(self): ret = None self.beginRead() try: if self.entry.has_key('enclosures'): for enc in self.entry.enclosures: if enc.has_key('thumbnail') and enc['thumbnail'].has_key('url'): ret = enc["thumbnail"]["url"] break if (ret is None and self.entry.has_key('thumbnail') and self.entry['thumbnail'].has_key('url')): ret = self.entry["thumbnail"]["url"] finally: self.endRead() if ret is None or not (ret.startswith('http:') or ret.startswith('https:')): ret = "resource:images/thumb.png" return ret ## # returns the title of the item def getTitle(self): try: return self.entry.title except: try: return self.entry.enclosures[0]["url"] except: return "" ## # Returns valid XHTML containing a description of the video def getDescription(self): self.beginRead() try: ret = xhtmlify(''+unescape(self.entry.enclosures[0]["text"])+'') except: try: ret = xhtmlify(''+unescape(self.entry.description)+'') except: ret = '' self.endRead() return ret ## # Returns formatted XHTML with release date, duration, format, and size def getDetails(self): details = [] reldate = self.getReleaseDate() duration = self.getDuration() format = self.getFormat() size = self.getSizeForDisplay() if len(reldate) > 0: details.append('%s' % escape(reldate)) if len(duration) > 0: details.append('%s' % escape(duration)) if len(format) > 0: details.append('%s' % escape(format)) if len(size) > 0: details.append('%s' % escape(size)) out = ' - '.join(details) return '<div class="main-video-details-under">%s</div>' % out ## # Stops downloading the item def stopDownload(self): for dler in self.downloaders: dler.stop() dler.remove() self.beginRead() try: self.downloaders = [] self.keep = False self.pendingManualDL = False finally: self.endRead() ## # returns status of the download in plain text def getState(self): self.beginRead() self.feed.beginRead() try: state = self.getStateNoAuto() if ((state == "stopped") and self.feed.isAutoDownloadable() and (self.feed.getEverything or self.getPubDateParsed() >= self.feed.startfrom)): state = "autopending" finally: self.feed.endRead() self.endRead() return state ## # returns the state of the download, without checking automatic dl # eligibility def getStateNoAuto(self): self.beginRead() try: if self.expired: state = "expired" elif self.startingDownload: state = "downloading" elif self.keep: state = "saved" elif self.pendingManualDL: state = "manualpending" elif len(self.downloaders) == 0: if self.lastDownloadFailed: state = "failed" else: state = "stopped" else: state = "finished" for dler in self.downloaders: newState = dler.getState() if newState != "finished": state = newState if state == "failed": break if (state == "finished" or state=="uploading") and self.seen: state = "watched" finally: self.endRead() return state def getFailureReason(self): ret = "" self.beginRead() try: if self.lastDownloadFailed: ret = "Could not connect to server" else: for dler in self.downloaders: if dler.getState() == "failed": ret = dler.getReasonFailed() break finally: self.endRead() return ret ## # Returns the size of the item to be displayed. If the item has a corresponding # downloaded enclosure we use the pysical size of the file, otherwise we use # the RSS enclosure tag values. def getSizeForDisplay(self): fname = self.getFilename() if fname != "" and os.path.exists(fname): size = os.stat(fname)[6] return self.sizeFormattedForDisplay(size) else: return self.getEnclosuresSize() ## # Returns the total size of all enclosures in bytes def getEnclosuresSize(self): size = 0 try: if self.entry.has_key('enclosures'): enclosures = self.entry['enclosures'] for enclosure in enclosures: size += int(enclosure['length']) except: pass return self.sizeFormattedForDisplay(size) ## # returns status of the download in plain text def getTotalSize(self): size = 0 for dler in self.downloaders: try: size += dler.getTotalSize() except: pass if size == 0: return "" return self.sizeFormattedForDisplay(size) ## # returns status of the download in plain text def getCurrentSize(self): size = 0 for dler in self.downloaders: size += dler.getCurrentSize() if size == 0: return "" return self.sizeFormattedForDisplay(size) ## # Returns a byte size formatted for display def sizeFormattedForDisplay(self, bytes, emptyForZero=True): if bytes > (1 << 30): return "%1.1fGB" % (bytes / (1024.0 * 1024.0 * 1024.0)) elif bytes > (1 << 20): return "%1.1fMB" % (bytes / (1024.0 * 1024.0)) elif bytes > (1 << 10): return "%1.1fKB" % (bytes / 1024.0) elif bytes > 1: return "%0.0fB" % bytes else: if emptyForZero: return "" else: return "n/a" ## # Returns the download progress in absolute percentage [0.0 - 100.0]. def downloadProgress(self): progress = 0 self.beginRead() try: size = 0 dled = 0 for dler in self.downloaders: try: size += dler.getTotalSize() dled += dler.getCurrentSize() except: pass if size > 0: progress = (100.0*dled) / size finally: self.endRead() return progress ## # Returns the width of the progress bar corresponding to the current # download progress. This doesn't really belong here and even forces # to use a hardcoded constant, but the templating system doesn't # really leave any other choice. def downloadProgressWidth(self): fullWidth = 92 # width of resource:channelview-progressbar-bg.png - 2 progress = self.downloadProgress() / 100.0 if progress == 0: return 0 return int(progress * fullWidth) ## # Returns string containing three digit percent finished # "000" through "100". def threeDigitPercentDone(self): return '%03d' % int(self.downloadProgress()) ## # Returns string with estimate time until download completes def downloadETA(self): secs = 0 for dler in self.downloaders: secs += dler.getETA() if secs == 0: return 'starting up...' elif (secs < 120): return '%1.0f secs left - ' % secs elif (secs < 6000): return '%1.0f mins left - ' % ceil(secs/60.0) else: return '%1.1f hours left - ' % ceil(secs/3600.0) ## # Returns the download rate def downloadRate(self): rate = 0 unit = "k/s" if len(self.downloaders) > 0: for dler in self.downloaders: rate = dler.getRate() rate /= len(self.downloaders) rate /= 1024 if rate > 1000: rate /= 1024 unit = "m/s" if rate > 1000: rate /= 1024 unit = "g/s" return "%d%s" % (rate, unit) ## # Returns the published date of the item def getPubDate(self): self.beginRead() try: try: ret = datetime(*self.entry.modified_parsed[0:7]).strftime("%b %d %Y") except: ret = "" finally: self.endRead() return ret ## # Returns the published date of the item as a datetime object def getPubDateParsed(self): self.beginRead() try: try: ret = datetime(*self.entry.modified_parsed[0:7]) except: ret = datetime.max # Is this reasonable? It should # avoid type issues for now, if # nothing else finally: self.endRead() return ret ## # returns the date this video was released or when it was published def getReleaseDate(self): try: return self.releaseDate except: try: self.releaseDate = datetime(*self.entry.enclosures[0].modified_parsed[0:7]).strftime("%b %d %Y") return self.releaseDate except: try: self.releaseDate = datetime(*self.entry.modified_parsed[0:7]).strftime("%b %d %Y") return self.releaseDate except: self.releaseDate = "" return self.releaseDate ## # returns the date this video was released or when it was published def getReleaseDateObj(self): if hasattr(self,'releaseDateObj'): return self.releaseDateObj self.beginRead() try: try: self.releaseDateObj = datetime(*self.entry.enclosures[0].modified_parsed[0:7]) except: try: self.releaseDateObj = datetime(*self.entry.modified_parsed[0:7]) except: self.releaseDateObj = datetime.min finally: self.endRead() return self.releaseDateObj ## # returns string with the play length of the video def getDuration(self, emptyIfZero=True): secs = 0 #FIXME get this from VideoInfo if secs == 0: if emptyIfZero: return "" else: return "n/a" if (secs < 120): return '%1.0f secs' % secs elif (secs < 6000): return '%1.0f mins' % ceil(secs/60.0) else: return '%1.1f hours' % ceil(secs/3600.0) ## # returns string with the format of the video KNOWN_MIME_TYPES = ('audio', 'video') KNOWN_MIME_SUBTYPES = ('mov', 'wmv', 'mp4', 'mp3', 'mpg', 'mpeg', 'avi') def getFormat(self, emptyForUnknown=True): try: enclosure = self.entry['enclosures'][0] if enclosure.has_key('type') and len(enclosure['type']) > 0: type, subtype = enclosure['type'].split('/') if type.lower() in self.KNOWN_MIME_TYPES: return subtype.split(';')[0].upper() else: extension = enclosure['url'].split('.')[-1].lower() if extension in self.KNOWN_MIME_SUBTYPES: return extension.upper() except: pass if emptyForUnknown: return "" else: return "n/a" ## # return keyword tags associated with the video separated by commas def getTags(self): self.beginRead() try: try: ret = self.entry.categories.join(", ") except: ret = "" finally: self.endRead() return ret ## # return the license associated with the video def getLicence(self): self.beginRead() try: try: ret = self.entry.license except: try: ret = self.feed.getLicense() except: ret = "" finally: self.endRead() return ret ## # return the people associated with the video, separated by commas def getPeople(self): ret = [] self.beginRead() try: try: for role in self.entry.enclosures[0].roles: for person in self.entry.enclosures[0].roles[role]: ret.append(person) for role in self.entry.roles: for person in self.entry.roles[role]: ret.append(person) except: pass finally: self.endRead() return ', '.join(ret) ## # returns the URL of the webpage associated with the item def getLink(self): self.beginRead() try: try: ret = self.entry.link except: ret = "" finally: self.endRead() return ret ## # returns the URL of the payment page associated with the item def getPaymentLink(self): self.beginRead() try: try: ret = self.entry.enclosures[0].payment_url except: try: ret = self.entry.payment_url except: ret = "" finally: self.endRead() return ret ## # returns a snippet of HTML containing a link to the payment page # HTML has already been sanitized by feedparser def getPaymentHTML(self): self.beginRead() try: try: ret = self.entry.enclosures[0].payment_html except: try: ret = self.entry.payment_html except: ret = "" finally: self.endRead() # feedparser returns escaped CDATA so we either have to change its # behavior when it parses dtv:paymentlink elements, or simply unescape # here... return '' + unescape(ret) + '' ## # Updates an item with new data # # @param entry a dict object containing the new data def update(self, entry): self.beginChange() try: self.entry = entry finally: self.endChange() ## # marks the item as having been downloaded now def setDownloadedTime(self): self.beginRead() try: self.downloadedTime = datetime.now() # Hack to immediately "save" items in feeds set to never expire self.keep = (self.feed.expire == "never") finally: self.endRead() ## # gets the time the video was downloaded # Only valid if the state of this item is "finished" def getDownloadedTime(self): self.beginRead() try: try: ret = self.downloadedTime except: ret = datetime.min finally: self.endRead() return ret ## # gets the time the video started downloading def getDLStartTime(self): self.beginRead() try: try: ret = self.DLStartTime except: ret = None finally: self.endRead() return ret ## # Returns the filename of the first downloaded video or the empty string def getFilename(self): self.beginRead() try: try: ret = self.downloaders[0].getFilename() except: ret = "" finally: self.endRead() return ret ## # Returns a list with the filenames of all of the videos in the item def getFilenames(self): ret = [] self.beginRead() try: try: for dl in self.downloaders: ret.append(dl.getFilename()) except: pass finally: self.endRead() return ret def getRSSEntry(self): self.beginRead() try: ret = self.entry finally: self.endRead() return ret def remove(self): for dler in self.downloaders: dler.remove() DDBObject.remove(self) ## # Called by pickle during serialization def __getstate__(self): temp = copy(self.__dict__) temp['dlFactory'] = None return (3,temp) ## # Called by pickle during serialization def __setstate__(self,state): (version, data) = state if version == 0: data['pendingManualDL'] = False if not data.has_key('linkNumber'): data['linkNumber'] = 0 version += 1 if version == 1: data['keep'] = False data['pendingReason'] = "" version += 1 if version == 2: data['creationTime'] = datetime.now() version += 1 assert(version == 3) data['startingDownload'] = False self.__dict__ = data # Older versions of the database allowed Feed Implementations # to act as feeds. If that's the case, change feed attribute # to contain the actual feed. # NOTE: This assumes that the feed object is decoded # before its items. That appears to be generally true if not issubclass(self.feed.__class__, DDBObject): try: self.feed = self.feed.ufeed except: self.__class__ = DropItLikeItsHot if self.__class__ is FileItem: self.__class__ = DropItLikeItsHot self.dlFactory = DownloaderFactory(self) #Dummy class for removing bogus FileItem instances class DropItLikeItsHot: __DropMeLikeItsHot = True def __slurp(self, *args, **kwargs): pass def __getattr__(self, attr): if attr == '__DropMeLikeItsHot': return self.__DropMeLikeItsHot else: print "DTV: WARNING! Attempt to call '%s' on DropItLikeItsHot instance" % attr return self.__slurp ## # An Item that exists as a file, but not as a download class FileItem(Item): def getEntry(self,filename): return FeedParserDict({'title':os.path.basename(filename),'enclosures':[{'url':filename}]}) def __init__(self,feed,filename): Item.__init__(self,feed,self.getEntry(filename)) self.filename = filename def getState(self): return "saved" def expire(self): try: os.remove(self.filename) except: pass self.remove() def getDownloadedTime(self): self.beginRead() try: try: time = datetime.fromtimestamp(os.getctime(self.filename)) except: return datetime.min finally: self.endRead() def getFilename(self): ret = '' try: ret = self.filename except: pass return ret def getFilenames(self): ret = [] try: ret = [self.filename] except: pass return ret